AI Shift: Agentic AI идва за количествени изследвания
Тази публикация е версия на място на нашия бюлетин The AI Shift. Премиум клиентите могат да се записват тук, с цел да получават бюлетина всеки четвъртък. Стандартните клиенти могат да надстроят до Premium тук или да прегледат всички бюлетини на FT
Добре пристигнали още веднъж в The AI Shift, нашето седмично гмуркане в разнообразни аспекти на въздействието на AI върху пазара на труда. Тази седмица: с неотдавнашния прогрес в агентния ИИ, пораждащ експлоадиране на екзистенциални рецесии в общността на обществените науки, ние преглеждаме какво вършат бързо подобряващите се кодиращи сътрудници върху производството на количествени проучвания и самооценката на тези, които ги правят.
Джон написа
Към днешна дата огромна част от фокуса върху работните места, изложени на AI, употребява разработчиците на програмен продукт като архетипния случай на специалност, чиито съставни задания се усещат тревожно близки до опциите на водещите огромни езикови модели. Но защото тези благоприятни условия се разшириха, описът с специалности, чиито заемащи длъжности поглеждат внимателно през рамото им, набъбна.
Това беше доста ускорено през последните месеци от излитането на агентни LLM принадлежности като Claude Code на Anthropic и Codex CLI на OpenAi, които съставляват стъпка на смяна от LLM в стила на чатбот в браузъра или в приложението, каквито са множеството хора употребен за. Първо, техният агентски темперамент значи, че те са овластени освен да пишат, само че и да работят. Второ, посредством работа непосредствено на личния компютър на потребителя - сърфиране в мрежата; евакуиране на материали; достъп, манипулиране и основаване на файлове — те могат да извършват всъщност всяка задача, която потребителят би могъл да извърши самичък.
За общността на обществените науки, доста от които се срещат с новите принадлежности през последните седмици, това се оказа или вълнуващо, или смущаващо, или и двете. Типичен тестов случай е да вземете предходна част от личното си проучване, да помолите инструмент за агентно шифроване да възпроизведе цялото нещо през цялото време, по-късно да го помолите да откри и включи нови данни, да актуализира разбора и резултатите и да напише новите открития. Резултатите, по всички сметки, са впечатляващи и се простират до изцяло свежи разбори на нови данни. Не се задоволявах да виждам в профил, аз самият пробвах предходната седмица, накарах Claude Code да повтори и разшири моя разбор на данните за пазара на труда в Съединени американски щати от скорошна колона. Той мина с блестящи цветове (въпреки че диаграмите ми изглеждаха по-хубави).
Какво да върша с всичко това?
Нека стартираме с главния факт, че събирането, почистването и анализирането на данни, които в миналото биха лишили часове или постоянно дни, в този момент могат да се правят за минути, в това число инспекции за неточности. При равни други условия по-бързата и по-възпроизводима количествена работа сигурно ще бъде позитивна за научните проучвания (въпреки че младшите асистенти, чиято работа постоянно се състои от писане на код за разчистване и разбор, може да се усещат по-малко подтикнати от това развитие). Казано най-просто, способността да се повторят и разширят съществуващите проучвания има капацитета да позволи „ рецесията на репликация “, която изтезава цели области от десетилетия. Но, повтаряйки тематики, които се появиха в по-ранни бюлетини, резултатите от втори ред са мястото, където става изключително забавно.
Първо: по-бързото извършване на нещата е явно позитивно, в случай че нещата, които се правят по-бързо, са скъпи и спомагателните неща, направени със извоюваното време, също са скъпи. Но не постоянно е ясно, че това е правилно. Както разсъждава професорът по стопанска система Джошуа Ганс, когато намалите разноските за осъществяване на нещо, хората ще създадат повече от него, само че това нормално значи понижаване на качеството на маргиналната активност, която се прави.
В обществените науки това може да значи повече проучвания с ниско качество: писане на второкласни хрумвания, които не биха били подхванати, в случай че изискваха повече старания. Това е в сходство с това, което сме виждали в кандидатурите за работа, и е подкрепено от документ, оповестен предишния месец (преди новите агентски инструменти), който открива, че откривателите, които употребяват LLM, разгласяват доста повече публикации, само че огромна част от спомагателната работа е с релативно ниско качество и AI размива сигналите, употребявани преди този момент за разкриване на скъпа работа. Ако издигането на агентния ИИ просто значи, че тръбопроводът за научно издание се запушва с посредствени публикации, крайният резултат може даже да е негативен (въпреки че несъмнено това е доста песимистично мнение).
Това визира втори въпрос: дали анализът на данни постоянно е бил доста спънка в проучванията. Ако беше по този начин, в този момент трябваше да забележим детонация във висококачествени нови прозрения. Но в случай че броячът рядко е ограничителен фактор при даването на висококачествена просвета, а по-скоро рутинна стъпка по пътя, тогава даже трагичните усъвършенствания в успеваемостта на количествените проучвания биха могли да имат минимално влияние върху скоростта на пробивите или върху пазара на труда за обществени учени, чиито най-ценни умения биха останали недокоснати от AI.
В сходство с това, от социологическа и философска позиция, това е очарователно е да се гледа по какъв начин подобренията в качествата на AI карат висококвалифицирани количествени откриватели и инженери да преоценят значимостта на своите количествени умения. Кодирането бързо се преобразува от профилирано умеене в досадна, рутинна част от работата, като се появява консенсус, че в свят, в който AI към този момент може надеждно да се оправя със събирането, почистването и разбора на данни, същинската стойност, която откривателят или анализаторът носи, е в качеството и количеството на техните хрумвания – техния „ усет “ за това, което е забавно и значимо. Разбира се, да знаете каква статистическа работа да възложите на AI към момента изисква мощна количествена подготовка, само че може да си визиите бъдеще, в което мнозина, които харесват теорията, само че се гърчат във формулите, в този момент получават шанса да разцъфтят.
Сара, това е доста за дъвчене, само че бих желал да схвана вашата позиция като човек, който може би е малко отвън света на кодирането. Сърби ли ви да употребявате тези принадлежности в работата си?
Сара написа
Джон, това е тъкмо нещото, за което желая да употребявам AI. Вероятно съм добър образец за някой, чиято роля може да бъде обогатена от този вид принадлежности. Работя много с данни, само че не пиша код, което лимитира какъв брой упорит мога да бъда (без да се обръщам към нашия екип за данни за помощ). Миналата година се пробвах да накарам ChatGPT да прави онази досадна задача, която от време на време върша ръчно, макар че кара очите ми да се изцъклят (и такава задача, за която ти, Джон, просто би написал малко код).
Помолих го да изтегли публични данни за Обединеното кралство за заплатите по специалности за 10 години и да извлече междинното почасово възнаграждение на водачите за всяка година. Резултатите бяха много комични: оказа се, че моделът ChatGPT, който използвах, не можеше да изтегля файлове от мрежата - задоволително почтено - само че вместо просто да ми го каже, предложи да намеря и изтегля данните самичък, тъй като в противоположен случай " ще би трябвало да ги върша ръчно един по един - което лишава време ". Исках да изкрещя: " Да, тъкмо по тази причина желая ти да го направиш, а не аз! " Въпреки че знам по-добре, в сравнение с да антропоморфизирам LLM, си потеглих с възприятието, че съм водил диалог с ленив младеж, който дава обещание прекомерно доста и не извършва.
Тази седмица дадох същата задача на Claude Code и той направи тъкмо това, което желаех, единствено от тази подкана (последвана от моите разнообразни препоръчани стъпки по пътя): „ Моля, отидете на уеб страницата на Службата за национална статистика и изтеглете данните от ASHE за последните 10 години – по-специално междинното почасово възнаграждение за водачи на самолетни компании “. Показа ми какво прави, до момента в който вървеше, и когато ревизирах крайния резултат, беше верен. Въпреки това към момента нямам добър отговор за това по какъв начин да ревизира точността на изхода на машината по метод, който не анулира спестяванията на време.
Вземам две неща от това. Първо, това е увещание да продължите да актуализирате предходните си знания по отношение на това, на какво е и на какво не е кадърен AI, тъй като региона се развива толкоз бързо. Второ, това е добра илюстрация за това по какъв начин една и съща технология може да има евентуално разнообразни резултати върху даже много сходни експерти като теб и мен. Като човек, който няма умения за шифроване, се усещам напряко разчувствуван от опциите, които това отваря. Но ми е любопитно какво е възприятието за теб. Казвате, че някои откриватели с количествени умения изпитват известна екзистенциална рецесия. И вие ли?!
Джон отговаря . . .
Всъщност открих, че потреблението както на неагентски LLM, по този начин и на Claude Code през последните няколко месеца ускори възприятието за убеденост, което се изграждаше в мен от години, което е, че главната ми мощ е повече в концепциите, в сравнение с в уменията за програмиране. Като споделих това, това, което допускам, че към момента не съм изцяло интернализирал, е, че уменията за шифроване без подозрение са били ограничителен фактор за тълпи от други огромни изобретателни и питащи мозъци, което значи, че съм на път да се изправя пред голямо повишаване на конкуренцията, когато става въпрос за способността да извършвам от любознание!
Препоръчително четене
По тематиката за Claude Code, Келси Пайпър от The Argument има занимателна публикация за това за какво не може да спре да крещи на това (Сара)
Продължавайки нашите лични прогнози предходната седмица, научих доста от листата на екипа Understanding AI със 17 прогнози за идната година (Джон).
Препоръчани бюлетини за вас
Бюлетинът на Lex — Lex, нашата графа за вложения, разрушава главните тематики от седмицата с разбори от наградени създатели. Регистрирайте се тук
Working It — Всичко, от което се нуждаете, с цел да напреднете в работата, във входящата ви поща всяка сряда. Регистрирайте се тук